29 research outputs found
Use of Gene Ontology semantic information in protein interaction data visualization
The Gene Ontology project is an effort to structure knowledge on biological products and processes by adding semantic information to them. This is done in a systematic way so that this additional information can be automatically processed. In this contribution a protein-protein interaction
visualization algorithm is proposed, which combines protein interaction data with Gene Ontology semantic information. The
information is integrated using a semantic distance measure defined in ontologies or taxonomies. Multidimensional scaling is applied to this measure and the output complements protein interaction data in building an interaction visualization map.Peer ReviewedPostprint (published version
Search of phenotype-related candidate genes using Gene Ontology-based semantic similarity and protein interaction information: application to Brugada syndrome
This work presents a methodology for finding
phenotype candidate genes starting from a set of known related genes. This is accomplished by automatically mining
and organizing the available scientific literature using Gene Ontology-based semantic similarity. As a case study, Brugada
syndrome related genes have been used as input in order to obtain a list of other possible candidate genes related with this disease. Brugada anomaly produces a typical alteration in the Electrocardiogram and carriers of the disease show an increased probability of sudden death. Results show a set of semantically coherent proteins that are shown to be related with synaptic transmission and muscle contraction physiological processes.Peer ReviewedPostprint (published version
The Central role of KNG1 gene as a genetic determinant of coagulation pathway-related traits: Exploring metaphenotypes
Traditional genetic studies of single traits may be unable to detect the pleiotropic effects involved in complex diseases. To detect the correlation that exists between several phenotypes involved in the same biological process, we introduce an original methodology to analyze sets of correlated phenotypes involved in the coagulation cascade in genome-wide association studies. The methodology consists of a two-stage process. First, we define new phenotypic meta-variables (linear combinations of the original phenotypes), named metaphenotypes, by applying Independent Component Analysis for the multivariate analysis of correlated phenotypes (i.e. the levels of coagulation pathway鈥搑elated proteins). The resulting
metaphenotypes integrate the information regarding the underlying biological process (i.e. thrombus/clot formation). Secondly, we take advantage of a family based Genome Wide Association Study to identify genetic elements influencing these metaphenotypes and consequently thrombosis risk. Our study utilized data from the GAIT Project (Genetic Analysis of Idiopathic Thrombophilia). We obtained 15 metaphenotypes, which showed significant heritabilities, ranging from 0.2 to 0.7. These results indicate the importance of genetic factors in the variability of these traits. We found 4 metaphenotypes that showed significant associations with SNPs. The most relevant were those mapped in a region near the HRG, FETUB and KNG1 genes. Our results are provocative since they show that the KNG1 locus plays a central role as a genetic determinant of the entire coagulation pathway and thrombus/clot formation. Integrating data from multiple correlated measurements through metaphenotypes is a promising approach to elucidate the hidden genetic mechanisms underlying complex diseases.Postprint (published version
Medidas basadas en teor铆a de grafos y la predicci贸n de la morbosidad de genes
Estudios previos sugieren que las redes de interacci贸n entre prote铆nas presentan propiedades de la teor铆a de grafos
que pueden tener cierta relaci贸n con la morbosidad de los genes. En particular, se ha sugerido que cuando un polimor smo afecta a un gen, es m谩s probable que se produzca una enfermedad si el grado de ese gen en una red de interacci贸n entre prote铆nas es elevado. Sin embargo, estos resultados no tienen en cuenta el posible sesgo intro-
ducido en los datos por la variaci贸n en la cantidad de informaci贸n que se tiene sobre los diferentes genes. En este trabajo se intenta modelar la morbosidad de genes como
una combinaci贸n lineal de los grados de los nodos en redes de interacci贸n entre prote铆nas y la cantidad de informaci贸n
sobre genes disponible en la literatura. Un conjunto de 7461 genes y 3665 enfermedades reportadas en la base de datos Online Mendelian Inheritance in Man (OMIM) fue
utilizado conjuntamente con una red de interacciones entre prote铆nas de 9630 nodos y 38756 interacciones de la Human Proteome Resource Database (HPRD). La cantidad
de informaci贸n disponible para cada gen se ha medido minando la base de datos PubMed. Los resultados sugieren que la correlaci贸n entre el grado de un nodo en la red de
interacciones entre prote铆nas y la morbosidad del gen que el nodo representa es consecuencia, al menos en una parte
considerable, de la variaci贸n en la cantidad de informaci贸n disponible para los diferentes genes. Aunque los resultados
sugieren una correlaci贸n positiva entre el grado de un nodo y su morbosidad, los autores creen que esta correlaci贸n debe ser considerada con precauci贸n puesto que podr铆a estar afectada por factores que no se consideraron en este estudio.Peer ReviewedPostprint (author鈥檚 final draft
Caracterizaci贸n y an谩lisis de las interacciones de regulaci贸n entre los factores de transcripci贸n y los genes
El estudio y la comprensi贸n de las redes de
interacci贸n entre prote铆nas es fundamental para entender el funcionamiento de los diferentes procesos biol贸gicos a nivel
celular. El conjunto de interacciones entre prote铆nas, definido como interactoma, es muy complejo debido al n煤mero y a los diferentes tipos de interacciones existentes. En este contexto, estudiar las interacciones de regulaci贸n entre prote铆na y 谩cido desoxirribonucleico (Factor de Transcripci贸n -ADN) es importante para comprender el nivel de expresi贸n de los genes afectados. El principal objetivo de este trabajo es la
caracterizaci贸n desde el punto de vista estad铆stico de los factores de transcripci贸n que regulan un gen y de los genes regulados
por un factor de transcripci贸n. Los datos han sido obtenidos de la base de datos String 1 y de la aplicaci贸n de miner铆a de datos de SabioSciences 2. El trabajo se centra en las interacciones de regulaci贸n TF-gen para el organismo Homo sapiens.Peer ReviewedPostprint (author鈥檚 final draft
Herramientas bioinform谩ticas para el an谩lisis de resultados de experimentos de expresi贸n g茅nica
En este estudio se propone una metodolog铆a que combina datos de expresi贸n diferencial con informaci贸n de expresi贸n entre prote铆nas. El objetivo es enriquecer los resultados de un experimento de expresi贸n con nuevos genes que no fueron tenidos en cuenta en el dise帽o del experimento pero que podr铆an tener cierta relevancia en los procesos que muestran expresi贸n diferencial. El m茅todo se basa en el estudio de las v铆as prote贸micas que conectan genes con expresi贸n diferencial significativa.Peer ReviewedPostprint (author鈥檚 final draft
Medidas basadas en teor铆a de grafos y la predicci贸n de la morbosidad de genes
Estudios previos sugieren que las redes de interacci贸n entre prote铆nas presentan propiedades de la teor铆a de grafos
que pueden tener cierta relaci贸n con la morbosidad de los genes. En particular, se ha sugerido que cuando un polimor smo afecta a un gen, es m谩s probable que se produzca una enfermedad si el grado de ese gen en una red de interacci贸n entre prote铆nas es elevado. Sin embargo, estos resultados no tienen en cuenta el posible sesgo intro-
ducido en los datos por la variaci贸n en la cantidad de informaci贸n que se tiene sobre los diferentes genes. En este trabajo se intenta modelar la morbosidad de genes como
una combinaci贸n lineal de los grados de los nodos en redes de interacci贸n entre prote铆nas y la cantidad de informaci贸n
sobre genes disponible en la literatura. Un conjunto de 7461 genes y 3665 enfermedades reportadas en la base de datos Online Mendelian Inheritance in Man (OMIM) fue
utilizado conjuntamente con una red de interacciones entre prote铆nas de 9630 nodos y 38756 interacciones de la Human Proteome Resource Database (HPRD). La cantidad
de informaci贸n disponible para cada gen se ha medido minando la base de datos PubMed. Los resultados sugieren que la correlaci贸n entre el grado de un nodo en la red de
interacciones entre prote铆nas y la morbosidad del gen que el nodo representa es consecuencia, al menos en una parte
considerable, de la variaci贸n en la cantidad de informaci贸n disponible para los diferentes genes. Aunque los resultados
sugieren una correlaci贸n positiva entre el grado de un nodo y su morbosidad, los autores creen que esta correlaci贸n debe ser considerada con precauci贸n puesto que podr铆a estar afectada por factores que no se consideraron en este estudio.Peer Reviewe
Graph theory-based measures as predictors of gene morbidity
Previous studies have suggested that some graph properties of protein interaction networks might be related with
gene morbidity. In particular, it has been suggested that when a polymorphism affects a gene, it is more likely to produce a
disease if the node degree in the interaction network is higher than for other genes. However, these results do not take into account the possible bias introduced by the variance in the amount of information available for different genes. This work
models the relationship between the morbidity associated with a gene and the degrees of the nodes in the protein interaction network controlling the amount of information available in the literature. A set of 7461 genes and 3665 disease identifiers reported in the Online Mendelian Inheritance in Man (OMIM) was mined jointly with 9630 nodes and 38756 interactions of the
Human Proteome Resource Database (HPRD). The information available from a gene was measured through PubMed mining. Results suggest that the correlation between the degree of a node in the protein interaction network and its morbidity is largely contributed by the information available from the gene. Even though the results suggest a positive correlation between
the degree of a node and its morbidity while controlling the information factor, we believe this correlation has to be taken
with caution for it can be affected by other factors not taken into account in this study.Peer Reviewe